CSV文件拆分一列数据为两列

最新推荐文章于 2024-04-24 15:56:44 发布

action825

最新推荐文章于 2024-04-24 15:56:44 发布

阅读量3k

点赞数

本文链接：https://blog.csdn.net/action825/article/details/107543340

版权

有需求把csv文件中某一列TERM的数据拆分成2列

df = pd.read_csv('/data/xxx/规则汇总.csv',encoding='GBK')
df.loc[df["TERM"].astype(str)=="0","TERM"]=":0"
df.loc[df["TERM"].astype(str)=="3","TERM"]=":3"
df.loc[df["TERM"].astype(str)=="4","TERM"]=":4"
df.loc[df["TERM"].isnull()==True,"TERM"]=":"
df.loc[df["TERM"].astype(str)=="总逾期次数0","TERM"]="总逾期次数:0"
df["TERM_A"],df["TERM_B"]=df["TERM"].str.replace("：",":").str.replace("xx分","xx分:").str.split(":",1).str
df.to_csv("/data/xxx/规则汇总2.csv",index=False,sep=',')

后来发现导出的csv文件中文是乱码，excel能够正确识别用gb2312、gbk、gb18030或utf_8 with BOM 编码的中文，所以测试了下，添加了参数 encoding=‘gbk’ 或者 encoding=‘utf-8-sig’

关于utf-8与utf_8_sig的区别：
UTF-8以字节为编码单元，它的字节顺序在所有系统中都是一様的，没有字节序的问题，也因此它实际上并不需要BOM(“ByteOrder Mark”)。但是UTF-8 with BOM即utf-8-sig需要提供BOM。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

action825

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
CSV文件拆分一列数据为两列

有需求把csv文件中某一列TERM的数据拆分成2列df = pd.read_csv('/data/xxx/规则汇总.csv',encoding='GBK')df.loc[df["TERM"].astype(str)=="0","TERM"]=":0"df.loc[df["TERM"].astype(str)=="3","TERM"]=":3"df.loc[df["TERM"].astype(str)=="4","TERM"]=":4"df.loc[df["TERM"].isnull()==True
复制链接

扫一扫